doi: 10.17586/2226-1494-2025-25-1-68-77


УДК 004.93'1

Метод семантической сегментации данных воздушного лазерного сканирования водоохранных зон 

Сай С.В., Зинкевич А.В.


Читать статью полностью 
Язык статьи - русский

Ссылка для цитирования:
Сай С.В., Зинкевич А.В. Метод семантической сегментации данных воздушного лазерного сканирования водоохранных зон // Научно-технический вестник информационных технологий, механики и оптики. 2025. Т. 25, № 1. С. 68–77. doi: 10.17586/2226-1494-2025-25-1-68-77


Аннотация
Введение. Выполнена оценка эффективности нейросетевого метода семантической сегментации трехмерных облаков точек, полученных с использованием беспилотного летательного аппарата «Геоскан 401 Лидар». Реализована нейронная сеть, основанная на модели глубокого обучения PointNet++, которая использует метод непосредственной обработки облаков точек. Разработана методика получения и подготовки набора данных с четырьмя классами: земля, растительность, транспортные средства и строительные объекты. Для увеличения точности оценки предложена методика, основанная на аугментации и перераспределении наборов данных. Метод. Модель нейронной сети состоит из иерархически построенных блоков, выполняющих выборку, группировку и извлечение признаков. Изменение количества блоков и задание радиуса поиска локальных признаков влияет на точность сегментации и вычислительные затраты. Основные результаты. Проведена оценка эффективности метода семантической сегментации трехмерных облаков точек, полученных с помощью беспилотного летательного аппарата. Методика аугментации и перераспределения наборов данных позволила улучшить среднее значение Intersection over Union (IoU) не менее, чем на 35 %. Для полученных данных определен оптимальный радиус в слое группировки, при котором обеспечивается баланс между детализацией и чувствительностью. Установлено, что увеличение количества точек в наборе данных не приводит к существенному росту точности, однако разнообразие используемых наборов данных улучшает эффективность подхода. Обсуждение. Разработанный набор данных позволяет повысить эффективность применяемого подхода, в том числе при обучении на иных моделях. Полученные результаты исследования свидетельствуют о перспективности использования предложенных методик и алгоритмов при решении задачи построения цифровых моделей реки Амур и ее основных притоков.

Ключевые слова: лидарная съемка, воздушное лазерное сканирование, облако точек, семантическая сегментация, нейронная сеть PointNet, гидрологические исследования

Благодарности. Исследование выполнено за счет гранта Российского научного фонда № 24-11-20024 и Министерства образования и науки Хабаровского края (cоглашение № 124С/2024).

Список литературы
  1. Неров И.О., Краснопеев С.М., Бугаец А.Н., Беликов В.В., Глотко А.В., Борисова Н.М., Васильева Е.С., Кролевецкая Ю.В. Опыт создания цифровой модели рельефа для гидродинамических расчетов в бассейне р. Амур // Вестник ДВО РАН. 2021. N  6 (220). С. 45–55. https://doi.org/10.37102/0869-7698_2021_220_06_04
  2. Behley J., Garbade M., Milioto A., Quenzel J., Behnke S., Stachniss C., Gall J., SemanticKITTI: a dataset for semantic scene understanding of LiDAR sequences // Proc. of the IEEE/CVF International Conference on Computer Vision (ICCV). 2019. P. 9296–9306. https://doi.org/10.1109/iccv.2019.00939
  3. Angrish A., Bharadwaj A., Starly B. MVCNN++: Computer-Aided design model shape classification and retrieval using multi-view convolutional neural networks // Journal of Computing and Information Science in Engineering. 2021. V. 21. N 1. P. 011001. https://doi.org/10.1115/1.4047486
  4. Feng Y., Zhang Z., Zhao X., Ji R., Gao Y. GVCNN: group-view convolutional neural networks for 3D shape recognition // Proc. of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). 2018. P. 264–272. https://doi.org/10.1109/cvpr.2018.00035
  5. Li M., Cao Y., Wu H. Three-dimensional reconstruction for highly reflective diffuse object based on online measurement // Optics Communications. 2023. V. 533. P. 129276. https://doi.org/10.1016/j.optcom.2023.129276
  6. Sfikas K., Pratikakis I., Theoharis T. Ensemble of PANORAMA-based convolutional neural networks for 3D model classification and retrieval // Computers and Graphics. 2018. V. 71. P. 208–218. https://doi.org/10.1016/j.cag.2017.12.001 
  7. Riegler G., Ulusoy A.O., Geiger A. OctNet: learning deep 3D representations at high resolutions // Proc. of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR). 2017. P. 6620–6629. https://doi.org/10.1109/cvpr.2017.701
  8. Choy C., Gwak J., Savarese S. 4D spatio-temporal ConvNets: Minkowski convolutional neural networks // Proc. of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). 2019. P. 3070–3079. https://doi.org/10.1109/cvpr.2019.00319
  9. Hua B.-S., Tran M.-K., Yeung S.-K. Pointwise convolutional neural networks // Proc. of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR). 2018. P. 984–993. https://doi.org/10.1109/cvpr.2018.00109
  10. Li W., Luo Z., Xiao Z., Chen Y., Wang C., Li J. A GCN-Based method for extracting power lines and pylons from airborne LiDAR data // IEEE Transactions on Geoscience and Remote Sensing. 2022. V. 60. P. 1–14. https://doi.org/10.1109/TGRS.2021.3076107
  11. Wang Y., Sun Y., Liu Z., Sarma S.E., Bronstein M.M., Solomon, J.M. Dynamic graph CNN for learning on point clouds // ACM Transactions on Graphics. 2019. V. 38. N 5. P. 146. https://doi.org/10.1145/3326362
  12. Liang Z., Yang M., Deng L., Wang C., Wang B. Hierarchical depthwise graph convolutional neural network for 3D semantic segmentation of point clouds // Proc. of the International Conference on Robotics and Automation (ICRA). 2019. P. 8152–8158. https://doi.org/10.1109/ICRA.2019.8794052
  13. Zhao Y., Zhou F., Guo B., Liu B. Spatial temporal graph convolution with graph structure self-learning for early MCI detection // Proc. of the IEEE 20th International Symposium on Biomedical Imaging (ISBI). 2023. P. 1–5. https://doi.org/10.1109/isbi53787.2023.10230807
  14. Qi C.R., Su H., Mo K., Guibas L.J. PointNet: deep learning on point sets for 3D classification and segmentation // Proc. of the IEEE conference on computer vision and pattern recognition (CVPR). 2017. P. 1–9. https://doi.org/10.1109/cvpr.2017.16
  15. Qi C.R., Li, Y, Su H., Guibas L.J. PointNet++: deep hierarchical feature learning on point sets in a metric space // arXiv. 2017. arXiv:1706.02413v1. https://doi.org/10.48550/arXiv.1706.02413
  16. Varney N., Asari, V.K., Graehling Q. DALES: a large-scale aerial LiDAR data set for semantic segmentation // Proc. of the IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops (CVPRW). 2020. P. 1–10. https://doi.org/10.1109/cvprw50498.2020.00101


Creative Commons License

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License
Информация 2001-2025 ©
Научно-технический вестник информационных технологий, механики и оптики.
Все права защищены.

Яндекс.Метрика